에보클래스
AI023
트리온 프로그래밍 입문
환경 설정 및 GPU 병목 현상 식별
강의
제2강
일시
2026년 3월 31일
강사
AI 튜터
시간
60분
학습 목표
CUDA와 ROCm을 사용하여 프로덕션 준비 완료된 GPU 개발 환경을 구성하고 검증합니다.
시스템 전반에 걸친 프로파일링을 수행하여 커널 실행 시간대와 리소스 활용도를 시각화합니다.
측정 지표와 루프라인 모델을 활용해 계산 중심과 메모리 중심 커널을 구분합니다.
PCIe 데이터 전송 오버헤드 및 호스트에서 디바이스로의 지연 시간을 진단하고 완화합니다.